评价模型

2020 A题“最好的暑期工作”(the best summer job)是一个典型的“评价问题”(也称为“综合评价问题”“决策问题”等)。评价问题指的是:在若干个(同类)对象中,从多个维度对其进行度量,综合这些度量后给出一个总分或总排名。 这种问题的困难之处在于多个指标之间会相互“竞争”,如何合理权衡指标的重要性并将其整合起来是关键。

暑期工作有很多候选项,比如公司文员、助理教师、售货员等都是可供选择的工作,它们各有特点,我们往往不是只看工作的某一方面而是综合各个方面然后选出最优工作。评价模型就是用于解决这类问题的数学模型。

评价问题有5个要素,分别是:

常用评价模型

比较较经典且常用的评价模型包括:

这些模型都有各自特点,比如TOPSIS方法是对数据进行整合处理、熵权法层次分析法(也叫AHP方法)用于权重处理,模糊评价方法可以对不精确的信息精确化。上面列到的几个加粗的方法在HiMCM比赛中比较常见,事实上2020年特等奖论文中大体也是这几类模型。

不过,虽然综合评价模型是评价模型的核心,但也要注意: 当然,我们除了要关注评价模型选择以外,也要注意:

这里不详述各个模型的细节(感兴趣的同学可以看“评价模型”系列文章),这里重点介绍几个帮助提升模型创新度的角度:合成指标、评价模型之间组合、评价模型与其他模型组合。

合成指标

当我们评选工作时,可能首先会列出一些“抽象”的指标,比如“累不累”“远不远”“难不难”等,书面化一些就是“工作强度”“通勤情况”“工作难度”。虽然这些指标是我们一般会考虑的,但岗位招聘中不大会专门给这几个抽象的指标进行打分(有的网站有类似功能,但很多时候也是主观打分,对于我们而言不一定能直接用),而是列出比如工作内容、公司地址、学历和专业要求等这些具体项目,我们需要基于这些具体项目合成抽象指标,来表达我们的一些抽象概念。就拿工作难度来看,难度可能与要求的学历、工作年限、专业水平等有关(这里只是举例,中学生学历等信息都摆在这里,也只能挑符合学历的工作),我们就可以将上述几个因素合成为一个指标,称之为“工作难度”指标

大的抽象的指标往往比较难找数据,而小的指标就容易多了。其实一个评价模型也可视为是合成指标的过程,我们不过是把子指标用更小的指标进行了合成而已。比如下面两幅图:

合成指标这一步不是为了将问题“复杂化”,而是通过更为细致的考虑使模型更可行。设想如果我们的模型要求用户输入“难度”“舒适度”等,用户可能不知道该如何输入这个数据,但让用户输入“学历”“工作时长”就容易多了。

评价模型之间组合

上面也谈到了不同评价模型有不同特点,有的是针对权重的,有的是针对数据的,那我们能否将权重模型和数据模型组合起来呢?比如一方面用权重模型如熵权法算出权重,接下来在将算好的权重放入TOPSIS方法(TOPSIS方法各个指标权重相同),这样我们合成的模型就还可以称之为“Entropy-TOPSIS”模型(熵权-TOPSIS方法)或简写为“ETOPSIS",也可以叫做“mTOPSIS"(modified-TOPSIS,改进版本TOPSIS方法)。这样我们就实现了模型的组合,也算作一种微创新吧。实际上不少优秀论文的模型都采用了评价模型的组合策略: 2020A题特等奖论文10549的模型就是采用了两种权重模型(熵权法+AHP方法)再平均的方式获得自己模型的权重以平衡主观权重与客观权重。 10701的论文则是AHP+TOPSIS模型的组合:

评价模型与其他模型的组合

除了通过多种评价模型进行组合以外(简称为“内部组合”),另外一种就是不同类别模型的组合。虽然一些赛题比较明显能看出是哪一类模型,比如“暑期工作”就是很典型的评价类问题,但与其他模型进行组合也往往能起到令人“耳目一新”的感觉。本赛题除了要求做出评价模型以外,还要求应用该模型,常规想法就是基于现有模型为用户推荐评分最高的一个或几个,但是我们在这个过程中也可以采纳其他的想法或模型进行推荐。就类似于我们打开各种APP,这些APP会给我们推荐基于我们偏好的内容一样,该问题也可以采纳类似想法,使用预测模型来“预测”用户的喜好,然后进行推荐。常用的算法就包括机器学习算法中分类算法和聚类算法。设想一下,在大部分论文都局限在评价模型内进行讨论时,一个有关联的但与众不同的模型出现在评委面前,是不是也会让评委印象深刻?

最后补充一点,经典的评价模型流程都是很明确的,但我们不能只想着“一套了之”,只顾套用模型,这样反而会让我们的受限。每个问题都有它自身的特点,要充分体会到每个问题“与众不同”的点,深入下去,才能让自己的模型更加适合也更加与众不同。